Tablas de contingencia de pobreza según la Nueva-Metodología para las Casen 2006-2020

Por comunas

Equipo DS DI

DataIntelligence
24-12-2021

En un proceso laberíntico logramos obtener las bases de datos que contenian las categorías de pobreza que coincidían con las tablas oficiales de corrección retroactiva de las Casen

Lectura de bases de datos Casen

direccion <- switch(2,"C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/","C:/Users/chris/Desktop/archivos grandes/")

dataset_06 <<- readRDS(paste0(direccion,"casen_2006_c.rds"))
dataset_06 <- mutate_if(dataset_06, is.factor, as.character)
dataset_09 <<- readRDS(paste0(direccion,"casen_2009_c.rds"))
dataset_09 <- mutate_if(dataset_09, is.factor, as.character) 
dataset_11 <<- readRDS(paste0(direccion,"casen_2011_c.rds"))
dataset_11 <- mutate_if(dataset_11, is.factor, as.character) 
dataset_13 <<- readRDS(paste0(direccion,"casen_2013_c.rds"))
dataset_13 <- mutate_if(dataset_13, is.factor, as.character) 
dataset_15 <<- readRDS(paste0(direccion,"casen_2015_c.rds"))
dataset_15 <- mutate_if(dataset_15, is.factor, as.character)
dataset_17 <<- readRDS(paste0(direccion,"casen_2017_c.rds"))
dataset_17 <- mutate_if(dataset_17, is.factor, as.character)
dataset_20 <<- readRDS(paste0(direccion,"casen_2020_c.rds"))
dataset_20 <- mutate_if(dataset_20, is.factor, as.character)

Base de datos Complementaria de Ingresos Nueva Metodología Casen 2006 SPSS

dataset_06$clave <- paste0(dataset_06$SEG,dataset_06$O,dataset_06$F)
MN_2006 <- read.spss("C:/Users/chris/Desktop/archivos grandes/Ingresos MN 2006.sav", to.data.frame = TRUE)
MN_2006$clave <- paste0(MN_2006$seg,MN_2006$o,MN_2006$f)

MN_2006_2 <- MN_2006[,c("clave","pobreza_MN")]
dataset_06 <- merge(x= dataset_06, y= MN_2006_2, by="clave")
dataset_06 <- mutate_if(dataset_06, is.factor, as.character)

Base de datos Complementaria de Ingresos Nueva Metodología Casen 2009 SPSS

dataset_09$clave <- paste0(dataset_09$SEGMENTO,dataset_09$IDVIV,dataset_09$HOGAR,dataset_09$O)
MN_2009 <- read.spss("C:/Users/chris/Desktop/archivos grandes/Ingresos MN 2009.sav", to.data.frame = TRUE)
MN_2009$clave <- paste0(MN_2009$SEGMENTO,MN_2009$IDVIV,MN_2009$HOGAR,MN_2009$O)

MN_2009_2 <- MN_2009[,c("clave","pobreza_MN")]
dataset_09 <- merge(x= dataset_09, y= MN_2009_2, by="clave")
dataset_09 <- mutate_if(dataset_09, is.factor, as.character) 

Base Complementaria Ingresos Nueva Metodología Casen 2011 (submuestra noviembre 2011-enero 2012) (Base 2011 utilizada para estimaciones de serie Casen) SPSS

dataset_11$clave <- paste0(dataset_11$folio,dataset_11$o)
MN_2011 <- read.spss("C:/Users/chris/Desktop/archivos grandes/Ingresos MN 2011.sav", to.data.frame = TRUE)
MN_2011$clave <- paste0(MN_2011$folio,MN_2011$o )

MN_2011_2 <- MN_2011[,c("clave","pobreza_MN")]
dataset_11 <- merge(x= dataset_11, y= MN_2011_2, by="clave")
dataset_11 <- mutate_if(dataset_11, is.factor, as.character) 

dataset_13$clave <- paste0(dataset_13$folio,dataset_13$o)
MN_2013 <- as.data.frame(read_dta("C:/Users/chris/Desktop/archivos grandes/casen_2013_ymt.dta"))
MN_2013$clave <- paste0(MN_2013$folio,MN_2013$o )

MN_2013_2 <- MN_2013[,c("clave","pobreza_mt")]
dataset_13 <- merge(x= dataset_13, y= MN_2013_2, by="clave")
dataset_13 <- mutate_if(dataset_13, is.factor, as.character) 
dataset_06$pobreza_MN[dataset_06$pobreza_MN == "No pobres"] <- "No pobre"
dataset_06$pobreza_MN[dataset_06$pobreza_MN == "Pobre"] <- "Pobre"
dataset_06$pobreza_MN[dataset_06$pobreza_MN == "Pobre extremo"] <- "Pobre extremo"

dataset_09$pobreza_MN[dataset_09$pobreza_MN == "No pobres"] <- "No pobre"
dataset_09$pobreza_MN[dataset_09$pobreza_MN == "Pobre"] <- "Pobre"
dataset_09$pobreza_MN[dataset_09$pobreza_MN == "Pobre extremo"] <- "Pobre extremo"

dataset_11$pobreza_MN[dataset_11$pobreza_MN == "No pobres"] <- "No pobre"
dataset_11$pobreza_MN[dataset_11$pobreza_MN == "Pobre"] <- "Pobre"
dataset_11$pobreza_MN[dataset_11$pobreza_MN == "Pobre extremo"] <- "Pobre extremo"

dataset_13$pobreza_MN[dataset_13$pobreza_MN == "No pobres"] <- "No pobre"
dataset_13$pobreza_MN[dataset_13$pobreza_MN == "Pobre"] <- "Pobre"
dataset_13$pobreza_MN[dataset_13$pobreza_MN == "Pobre extremo"] <- "Pobre extremo"

dataset_15$pobreza[dataset_15$pobreza == "No pobres"] <- "No pobre"
dataset_15$pobreza[dataset_15$pobreza == "Pobre"] <- "Pobre"
dataset_15$pobreza[dataset_15$pobreza == "Pobre extremo"] <- "Pobre extremo"

dataset_17$pobreza[dataset_17$pobreza == "No pobres"] <- "No pobre"
dataset_17$pobreza[dataset_17$pobreza == "Pobre"] <- "Pobre"
dataset_17$pobreza[dataset_17$pobreza == "Pobre extremo"] <- "Pobre extremo"

dataset_20$pobreza[dataset_20$pobreza == "No pobres"] <- "No pobre"
dataset_20$pobreza[dataset_20$pobreza == "Pobre"] <- "Pobre"
dataset_20$pobreza[dataset_20$pobreza == "Pobre extremo"] <- "Pobre extremo"

1 Generación de tablas de contingencia

df_tablas <- data.frame()

funcion1 <- function(n){
 
 xx<-switch(n,"2006","2009","2011","2013","2015","2017","2020")
 tanio <<- xx

 
 

if(xx==2006) {
  
eliminated <- dataset_06
a <- eliminated$pobreza_MN
b <- eliminated$COMUNA
anio <- 2006
}

if(xx==2009) {

eliminated <- dataset_09
a <- eliminated$pobreza_MN
b <- eliminated$COMUNA
anio <- 2009

}

if(xx==2011) {
  
eliminated <- dataset_11
a <- eliminated$pobreza_MN
b <- eliminated$comuna
anio <- 2011

}

if(xx==2013) {
  
eliminated <- dataset_13
a <- eliminated$pobreza_MN
b <- eliminated$comuna 
anio <- 2013

}
 

if(xx==2015) {
  
eliminated <- dataset_15
a <- eliminated$pobreza
b <- eliminated$comuna
anio <- 2015
}

if(xx==2017) {
  
eliminated <- dataset_17
a <- eliminated$pobreza
b <- eliminated$comuna
anio <- 2017
}

if(xx==2020) {
  
eliminated <-dataset_20
a <- eliminated$pobreza
b <- eliminated$comuna
anio <- 2020
}

################ -- frecuencia
expan<-switch(n,"EXPC","EXPC","expc_full","expc","expc_todas","expc","expc")

tabla_matp <-xtabs(eliminated[,(expan)]~a+b, data = eliminated)
tabla_matp <- as.data.frame(tabla_matp)
tabla_matp <-tabla_matp[!(tabla_matp$Freq == 0),]
df <- tabla_matp
df <- df[complete.cases(df), ]
################ 


 
names(df)[1] <- "Pobreza"
names(df)[2] <- "Comuna"
df$Año = anio

direc_cod_com <- paste0("C:/Users/chris/Desktop/archivos grandes/codigos_comunales_2006-2020.rds")
codigos_comunales <- readRDS(file = direc_cod_com)
names(codigos_comunales)[1] <- "Código"
names(codigos_comunales)[2] <- "Comuna"

tabla_df = merge( x = df, y = codigos_comunales, by = "Comuna", all.x = TRUE)
tabla_df2 <<- tabla_df 

}

data_df3 <- data.frame()
for (n in 1:7){
  funcion1(n)

  data_df3 <- rbind(data_df3,tabla_df2)
  assign(paste0("tabla_etnia_",tanio),data_df3)
  data_df3 <- data.frame()
  print(paste0("tabla_etnia_",tanio))
}
## [1] "tabla_etnia_2006"
## [1] "tabla_etnia_2009"
## [1] "tabla_etnia_2011"
## [1] "tabla_etnia_2013"
## [1] "tabla_etnia_2015"
## [1] "tabla_etnia_2017"
## [1] "tabla_etnia_2020"
data_df3 <- rbind(tabla_etnia_2006,tabla_etnia_2009,tabla_etnia_2011,tabla_etnia_2013,tabla_etnia_2015,tabla_etnia_2017,tabla_etnia_2020)

##############
datatable(data_df3, extensions = 'Buttons', escape = FALSE, rownames = FALSE,
          options = list(dom = 'Bfrtip',
          buttons = list('colvis', list(extend = 'collection',
          buttons = list(
          list(extend='copy'),
          list(extend='excel',
            filename = 'tabla_etnia_pobreza'),
          list(extend='pdf',
            filename= 'tabla_etnia_pobreza')),
          text = 'Download')), scrollX = TRUE))

2 No pobre

df1 <- filter(data_df3, Pobreza == "No pobre",  Año == 2006 )
df2 <- filter(data_df3, Pobreza == "No pobre",  Año == 2009 )
df3 <- filter(data_df3, Pobreza == "No pobre",  Año == 2011 )
df4 <- filter(data_df3, Pobreza == "No pobre",  Año == 2013 )
df5 <- filter(data_df3, Pobreza == "No pobre",  Año == 2015 )
df6 <- filter(data_df3, Pobreza == "No pobre",  Año == 2017 )
df7 <- filter(data_df3, Pobreza == "No pobre",  Año == 2020 )

names(df1)[c(2,3)] <- c("No pobreza1","Freq1")
names(df2)[c(2,3)] <- c("No pobreza2","Freq2")
names(df3)[c(2,3)] <- c("No pobreza3","Freq3")
names(df4)[c(2,3)] <- c("No pobreza4","Freq4")
names(df5)[c(2,3)] <- c("No pobreza5","Freq5")
names(df6)[c(2,3)] <- c("No pobreza6","Freq6")
names(df7)[c(2,3)] <- c("No pobreza7","Freq7")

df8 <- merge(x=df1, y= df2[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df3[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df4[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df5[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df6[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df7[,c(2,3,5)], by= "Código")
df8 <- df8[,c(2,1,3,4,6:17,5)]
df8 <- mutate_if(df8, is.factor, as.character)
 
p <- plot_ly(df8, width = 1200,  x = ~Comuna, y = ~Freq1,   name = 'No pobre 2006', mode = 'markers') %>% add_lines()
p <- p %>% add_lines(y = ~Freq2, name = 'No pobre 2009', mode = 'markers')
p <- p %>% add_lines(y = ~Freq3, name = 'No pobre 2011', mode = 'markers')
p <- p %>% add_lines(y = ~Freq3, name = 'No pobre 2013', mode = 'markers')
p <- p %>% add_lines(y = ~Freq4, name = 'No pobre 2015', mode = 'markers')
p <- p %>% add_lines(y = ~Freq5, name = 'No pobre 2017', mode = 'markers')
p <- p %>% add_lines(y = ~Freq6, name = 'No pobre 2020', mode = 'markers') 
p

3 Pobre

df1 <- filter(data_df3, Pobreza == "Pobres no extremos",  Año == 2006 )
df2 <- filter(data_df3, Pobreza == "Pobres no extremos",  Año == 2009 )
df3 <- filter(data_df3, Pobreza == "Pobres no extremos",  Año == 2011 )
df4 <- filter(data_df3, Pobreza == "Pobres no extremos",  Año == 2013 )
df5 <- filter(data_df3, Pobreza == "Pobres no extremos",  Año == 2015 )
df6 <- filter(data_df3, Pobreza == "Pobres no extremos",  Año == 2017 )
df7 <- filter(data_df3, Pobreza == "Pobres no extremos",  Año == 2020 )

names(df1)[c(2,3)] <- c("Pobreza1","Freq1")
names(df2)[c(2,3)] <- c("Pobreza2","Freq2")
names(df3)[c(2,3)] <- c("Pobreza3","Freq3")
names(df4)[c(2,3)] <- c("Pobreza4","Freq4")
names(df5)[c(2,3)] <- c("Pobreza5","Freq5")
names(df6)[c(2,3)] <- c("Pobreza6","Freq6")
names(df7)[c(2,3)] <- c("Pobreza7","Freq7")

df8 <- merge(x=df1, y= df2[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df3[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df4[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df5[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df6[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df7[,c(2,3,5)], by= "Código")
df8 <- df8[,c(2,1,3,4,6:17,5)]
df8 <- mutate_if(df8, is.factor, as.character)
 
p <- plot_ly(df8, width = 1200,  x = ~Comuna, y = ~Freq1,   name = 'Pobre 2006', mode = 'markers') %>% add_lines()
p <- p %>% add_lines(y = ~Freq2, name = 'Pobre 2009', mode = 'markers')
p <- p %>% add_lines(y = ~Freq3, name = 'Pobre 2011', mode = 'markers')
p <- p %>% add_lines(y = ~Freq3, name = 'Pobre 2013', mode = 'markers')
p <- p %>% add_lines(y = ~Freq4, name = 'Pobre 2015', mode = 'markers')
p <- p %>% add_lines(y = ~Freq5, name = 'Pobre 2017', mode = 'markers')
p <- p %>% add_lines(y = ~Freq6, name = 'Pobre 2020', mode = 'markers') 
p

4 Pobre extremo

df1 <- filter(data_df3, Pobreza == "Pobres extremos",  Año == 2006 )
df2 <- filter(data_df3, Pobreza == "Pobres extremos",  Año == 2009 )
df3 <- filter(data_df3, Pobreza == "Pobres extremos",  Año == 2011 )
df4 <- filter(data_df3, Pobreza == "Pobres extremos",  Año == 2013 )
df5 <- filter(data_df3, Pobreza == "Pobres extremos",  Año == 2015 )
df6 <- filter(data_df3, Pobreza == "Pobres extremos",  Año == 2017 )
df7 <- filter(data_df3, Pobreza == "Pobres extremos",  Año == 2020 )

names(df1)[c(2,3)] <- c("Pobreza1","Freq1")
names(df2)[c(2,3)] <- c("Pobreza2","Freq2")
names(df3)[c(2,3)] <- c("Pobreza3","Freq3")
names(df4)[c(2,3)] <- c("Pobreza4","Freq4")
names(df5)[c(2,3)] <- c("Pobreza5","Freq5")
names(df6)[c(2,3)] <- c("Pobreza6","Freq6")
names(df7)[c(2,3)] <- c("Pobreza7","Freq7")

df8 <- merge(x=df1, y= df2[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df3[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df4[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df5[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df6[,c(2,3,5)], by= "Código")
df8 <- merge(x=df8, y= df7[,c(2,3,5)], by= "Código")
df8 <- df8[,c(2,1,3,4,6:17,5)]
df8 <- mutate_if(df8, is.factor, as.character)
 
p <- plot_ly(df8, width = 1200,  x = ~Comuna, y = ~Freq1,   name = 'Pobre extremo 2006', mode = 'markers') %>% add_lines()
p <- p %>% add_lines(y = ~Freq2, name = 'Pobre extremo 2009', mode = 'markers')
p <- p %>% add_lines(y = ~Freq3, name = 'Pobre extremo 2011', mode = 'markers')
p <- p %>% add_lines(y = ~Freq3, name = 'Pobre extremo 2013', mode = 'markers')
p <- p %>% add_lines(y = ~Freq4, name = 'Pobre extremo 2015', mode = 'markers')
p <- p %>% add_lines(y = ~Freq5, name = 'Pobre extremo 2017', mode = 'markers')
p <- p %>% add_lines(y = ~Freq6, name = 'Pobre extremo 2020', mode = 'markers') 
p